Can AI Match Human Experts? Evaluating LLM-Generated Feedback on Resident Scholarly Projects
Este estudio demuestra que un modelo de lenguaje grande de código abierto (LLaMA-3.1) puede generar retroalimentación formativa para proyectos académicos de residentes con una calidad que se aproxima a la de expertos humanos, superándolos incluso en ciertos contextos específicos y evaluaciones de seguridad.